FILTER MODE ACTIVE

#эффективность данных

Найдено записей: 4

#эффективность данных06.10.2025

78 примеров и огромный прирост: LIMI превращает крошевые наборы данных в мощные софт-агенты

'LIMI использует 78 курированных траекторий, чтобы дообучить модели GLM и получить 73.5% на AgencyBench, опережая базовые SFT-модели с тысячами примеров.'

ЧИТАТЬ →

#эффективность данных10.08.2025

От 100 000 до менее 500: как Google с помощью активного обучения сокращает разметку для LLM

'Google демонстрирует, что дообучение LLM возможно с менее чем 500 целевыми метками, сохраняя или улучшая качество модели при сокращении объема разметки на несколько порядков.'

ЧИТАТЬ →

#эффективность данных30.06.2025

DSRL: Управление роботами через обучение с подкреплением в латентном пространстве для реальной адаптации

DSRL представляет инновационный метод адаптации диффузионных политик роботов с помощью обучения с подкреплением в латентном пространстве, значительно улучшая результаты в реальных условиях без изменения базовой модели.

ЧИТАТЬ →

#эффективность данных03.05.2025

Революция в математическом мышлении: как 1-shot reinforcement learning улучшает работу LLM

Исследователи показали, что обучение больших языковых моделей с помощью всего одного примера значительно улучшает их способности решать математические задачи, достигая результатов, сопоставимых с обучением на больших наборах данных.

ЧИТАТЬ →